qwen科幻影视_第2页

刚刚，Thinking Machines Lab博客提出在策略蒸馏，Qwen被cue 38次

在策略蒸馏（on-policy distillation）是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时，TML 发现在策略蒸馏可以极低的成本超越其他方法。

博客 qwen thinkingmachines think 2025-10-28 08:41 8

中美AI炒币炒股阶段战果出炉：DeepSeek与Qwen稳健致胜，Gemini高频交易策略失效

近日，号称是首个专注于金融市场的 AI 实验室的美国实验室 Nof1 启动了一个将多个 AI 大模型置于真实金融市场中进行自动化交易对决的实验平台。这一项目的名称叫做 Alpha Arena，它是一个 AI 大模型实盘交易竞赛。

gemini deepseek 炒股 qwen 高频交易 2025-10-27 22:08 5

AI炒币斗兽场：DeepSeek领跑，Qwen后来居上成第一

这不是什么模拟演练，是真金白银让AI去炒币主办方nof1给六个当红AI大模型，比如通义千问Qwen、DeepSeek、GPT-5这些，每一个都发了一万美金本金，让它们在币圈这个真赌场里比高低。

斗兽场 deepseek qwen ai炒币炒币斗兽场 2025-10-27 17:26 5

阿里巴巴Qwen团队推出实时多模态AI模型

这项由阿里巴巴Qwen团队完成的突破性研究发表于2025年9月，论文编号为arXiv:2509.17765v1。有兴趣深入了解的读者可以通过该编号在学术数据库中查询完整论文。这项研究首次实现了一个AI模型同时精通文字、语音、图像和视频处理，而且在每个领域的表现

模型模态阿里巴巴 qwen qwen团队 2025-10-09 23:07 7

手机能跑的3B推理模型开源，比Qwen 3-4B还快，超长上下文不降速

昨日，以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数，可在包括手机、电脑在内的多种设备端运行，性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。

智能体开源 transformer qwen gemma 2025-10-09 18:40 9

阿里亲身入局具身智能！Qwen内部组团，通义千问技术负责人带队

而阿里，也成为了继OpenAI、Google等之后，又一家宣布入局具身智能赛道的大模型大厂。

智能林俊负责人 qwen qwen内部 2025-10-09 15:12 8

Qwen要做机器人了：林俊旸官宣成立具身智能团队

昨天，阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣，他们在 Qwen 内部组建了一个小型机器人、具身智能团队，同时表示「多模态基础模型正转变为基础智能体，这些智能体可以利用工具和记忆通过强化学习进行长程推理，它们绝对应该从虚拟世界走向物理世界」。

智能机器人林俊黄仁勋 qwen 2025-10-09 14:12 7

速递｜阿里在Qwen内部组建机器人团队，最年轻P10、北大校友林俊旸领衔

公司在大模型部门通义千问内组建了一个新的“小队”——机器人与具身智能团队。消息的源头不是官方通稿，而是阿里高管林俊旸在 X 上的一句话：“多模态模型正变成能处理长时序推理任务的基础智能体，而这些智能体——理应从虚拟世界走向物理世界。”

机器人林俊速递 qwen qwen内部 2025-10-09 08:30 8

硅谷聚会｜和Qwen的科学家在Tech Week聊聊开源

今年的Tech Week更加火热，据说一整周时间里有超过1000场大小活动在这座城市的范围里展开。

开源硅谷聚会 qwen techweek 2025-10-04 16:11 8

AIME'25满分炸场！Qwen一波七连发，全家桶大更新

金磊发自凹非寺量子位 | 公众号 QbitAI它来了，它来了！新一代旗舰模型Qwen3-Max带着满分成绩，正式地来了——国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分！

推理 aime 金磊 qwen qwen一波 2025-09-25 16:09 11

雷军：造车和重启造芯把小米攒下的家底全押上了；李想评iPhone Pro Max太丑了；阿里Qwen发布6个“新东西”|极客头条

雷军：造车和重启造芯几乎是同时做的决策，把小米前十年攒下的家底全押上了原英特尔芯片架构师苏菲回国，加盟清华大学华为模型交互专利公布理想汽车 CEO 李想谈苹果 iPhone 17 系列手机：今年不会再买 Pro Max 了，实在太丑了马斯克回应 OpenAI

雷军极客李想 qwen 全押 2025-09-24 10:31 10

美股异动｜阿里巴巴涨超2%创2021年10月以来新高，Qwen团队预告今晚要发布6个“新东西”

阿里巴巴(BABA.US)涨超2%，最高触及167.82美元，创2021年10月以来新高。消息面上，阿里Qwen团队的负责人在X平台上透露，阿里Qwen团队今晚要发布6个“新东西”，1个产品，2个开源模型，3个API接口。(格隆汇)

开源阿里巴巴美股 qwen qwen团队 2025-09-23 22:33 12

Qwen开源版Banana来了！原生支持ControlNet

刚刚，Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。

图像编辑开源 controlnet banana qwen 2025-09-23 16:57 10

从零开始训练推理模型：GRPO+Unsloth改造Qwen实战指南

推理型大语言模型现在确实火了。这类模型的特点是会先对问题做充分思考，然后再给出答案，而不是直接回复。

qwen grpo qw unsloth unsloth改造 2025-09-21 19:34 11

亚马逊云科技为何上架Qwen和DeepSeek的最新模型

9月19日，在亚马逊云科技的Amazon Bedrock模型平台上，上架了两家中国模型公司的新模型，分别是阿里巴巴Qwen3系列四款模型、DeepSeek-V3.1。这两款模型上架Amazon Bedrock，也标志着标志中国的开源模型正在被全球云计算生态认可

模型亚马逊 deepseek bedrock qwen 2025-09-19 20:08 11

实测！Qwen下一代基础架构突袭！秒解AIME数学竞赛题

模型参数80B，但训练成本连Qwen3-32B的十分之一都不到，并且在32 k以上的上下文推理吞吐能达到后者的十倍以上。

架构数学竞赛 aime qwen aime数学竞赛 2025-09-12 16:48 10

替代 Claude Code，国产化 AI 编程方案来了！

近日，美国头部大模型公司 Anthropic 突然宣布，立即停止向所有由中国资本控股超过 50% 的企业提供 Claude 系列模型服务。基石智算CoresHub 推荐一个完全替代 Claude Code+Claude 模型的 AI 编程组合：Qwen Cod

编程 claude code qwen claudecode 2025-09-11 17:57 10

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒！

而且“全球最快开源AI模型”之外，MBZUAI官方还称自家的K2 Think是“有史以来最先进的开源 AI 推理系统”。

模型开源 aime qwen k2 2025-09-10 18:56 13

阿联酋开源“最快推理模型”，撞名Kimi，基于阿里Qwen，用上全球最大芯片

今日上午，阿布扎比穆罕默德·本·扎耶德人工智能大学（MBZUAI）联合AI创企G42推出的新低成本推理模型K2 Think，相关论文已arXiv预印本平台发表，昨天下午模型在Hugging Face、GitHub上开源。

阿联酋 kimi 开源芯片 qwen 2025-09-10 14:57 15

外媒评中国开源大模型：19家机构分五档，DeepSeek、Qwen领衔前沿

近年来，中国在大模型领域的发展势头迅猛，特别是开源社区贡献了大量高水平模型。2025年7月，全球最大人工智能开源社区Hugging Face榜单更新，前10名中有9个来自中国。

模型开源月之暗面 deepseek qwen 2025-09-09 18:46 12